Python读取Excel非常慢,应该如何优化?

您所在的位置:网站首页 openpyxl xlsm Python读取Excel非常慢,应该如何优化?

Python读取Excel非常慢,应该如何优化?

2023-03-11 13:28| 来源: 网络整理| 查看: 265

此前总结过Python中常用的表格读写库,pyexcel是花式大师,是对xlrd/xlwt等底层库的包装,接口纷繁,做一个事不止一种接口;xlrd/xlwt/xlutils是同一(组)人开发,中规中矩,最接近底层,要是能合成一个库就完美了;openpyxl仅支持Excel 2010以上格式文件,能读能写,接口简洁优雅。

现在看来要加一条,xlrd/xlwt/xlutils速度飞快,比openxlpy快了几个数量级。读一个几万行的Excel表,把其中某几列保存为字典,供后续使用,逐行遍历、逐个添加键-值对,openpyxl使用read_only参数,花了6个小时才遍历1w行左右,换成xlrd几十秒钟结束战斗,根本就不需要考虑多线程/多进程。(这里要修正一下,openpyxl中使用字符串形式的行列地址随机访问单元格时,内部实际是从头逐个匹配,速度越来越慢,大表格不建议使用;正确姿势是iter_rows、iter_cols迭代,再从一行/列里提取值,速度照样飞快)

silaoA:Python操作Excel文件(0):盘点

silaoA:Python操作Excel文件(1):花式大师pyexcel

silaoA:Python操作Excel文件(2):中规中矩三兄弟xlrd、xlwt和xlutils

silaoA:Python操作Excel文件(3):优雅干将openxlpy



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3